智能论文笔记

GasHis-Transformer: A Multi-scale Visual Transformer Approach for Gastric Histopathology Image Classification

Haoyuan Chen , Chen Li , Xiaoyan Li , Ge Wang , Weiming Hu , Yixin Li , Wanli Liu , Changhao Sun , Yudong Yao , Yueyang Teng

分类：计算机视觉

2021-04-29

现有的胃癌诊断深层学习方法，常用卷积神经网络。最近，视觉变压器由于其性能和效率而引起了极大的关注，但其应用主要在计算机视野领域。本文提出了一种用于Gashis变压器的多尺度视觉变压器模型，用于胃组织病理学图像分类（GHIC），其使微观胃图像自动分类为异常和正常情况。 GASHIS-COMPURANCER模型由两个关键模块组成：全球信息模块和局部信息模块有效提取组织病理特征。在我们的实验中，具有280个异常和正常图像的公共血毒素和曙红（H＆E）染色的胃组织病理学数据集分为训练，验证和测试组，比率为1：1：2胃组织病理学数据集测试组精度，召回，F1分数和准确性分别为98.0％，100.0％，96.0％和98.0％。此外，进行了关键的研究以评估Gashis变压器的稳健性，其中添加了10个不同的噪声，包括四种对抗性攻击和六种传统图像噪声。此外，执行临床上有意义的研究以测试Gashis变压器的胃肠癌鉴定性能，具有620个异常图像，精度达到96.8％。最后，进行比较研究以测试在淋巴瘤图像数据集和乳腺癌数据集上的H＆E和免疫组织化学染色图像的概括性，产生可比的F1分数（85.6％和82.8％）和精度（83.9％和89.4％），分别。总之，Gashistransformer演示了高分类性能，并在GHIC任务中显示出其显着潜力。

translated by 谷歌翻译

Multivariate Time Series Classification with Hierarchical Variational Graph Pooling

Ziheng Duan , Haoyan Xu , Yueyang Wang , Yida Huang , Anni Ren , Zhongbin Xu , Yizhou Sun , Wei Wang

分类：机器学习 | 人工智能

2020-10-12

随着传感技术的进步，多元时间序列分类（MTSC）最近受到了相当大的关注。基于深度学习的MTSC技术主要依赖于卷积或经常性神经网络，主要涉及单时间序列的时间依赖性。结果，他们努力直接在多变量变量中表达成对依赖性。此外，基于图形神经网络（GNNS）的当前空间 - 时间建模（例如，图形分类）方法本质上是平的，并且不能以分层方式聚合集线器数据。为了解决这些限制，我们提出了一种基于新的图形汇集框架MTPOOL，以获得MTS的表现力全球表示。我们首先通过采用通过图形结构学习模块的相互作用来将MTS切片转换为曲线图，并通过时间卷积模块获得空间 - 时间图节点特征。为了获得全局图形级表示，我们设计了基于“编码器 - 解码器”的变形图池池模块，用于为群集分配创建自适应质心。然后我们将GNN和我们所提出的变分图层汇集层组合用于联合图表示学习和图形粗糙化，之后该图逐渐赋予一个节点。最后，可差异化的分类器将此粗糙的表示来获取最终预测的类。 10个基准数据集的实验表明MTPOOL优于MTSC任务中最先进的策略。

translated by 谷歌翻译

MTHetGNN: A Heterogeneous Graph Embedding Framework for Multivariate Time Series Forecasting

Yueyang Wang , Ziheng Duan , Yida Huang , Haoyan Xu , Jie Feng , Anni Ren

分类：机器学习 | (统计)机器学习

2020-08-19

多变量时间序列预测，分析历史时序序列以预测未来趋势，可以有效地帮助决策。 MTS中变量之间的复杂关系，包括静态，动态，可预测和潜在的关系，使得可以挖掘MTS的更多功能。建模复杂关系不仅是表征潜在依赖性的必要条件以及建模时间依赖性，而且在MTS预测任务中也带来了极大的挑战。然而，现有方法主要关注模拟MTS变量之间的某些关系。在本文中，我们提出了一种新的端到端深度学习模型，通过异构图形神经网络（MTHETGNN）称为多变量时间序列预测。为了表征变量之间的复杂关系，在MTHETGNN中设计了一个关系嵌入模块，其中每个变量被视为图形节点，并且每种类型的边缘表示特定的静态或动态关系。同时，引入了时间嵌入模块的时间序列特征提取，其中涉及具有不同感知尺度的卷积神经网络（CNN）滤波器。最后，采用异质图形嵌入模块来处理由两个模块产生的复杂结构信息。来自现实世界的三个基准数据集用于评估所提出的MTHETGNN。综合实验表明，MTHETGNN在MTS预测任务中实现了最先进的结果。

translated by 谷歌翻译

CoSimGNN: Towards Large-scale Graph Similarity Computation

Haoyan Xu , Runjian Chen , Yueyang Wang , Ziheng Duan , Jie Feng

分类：机器学习 | (统计)机器学习

2020-05-14

在许多现实世界应用中，基于图表编辑距离（GED）等指标（GED）等图表之间计算相似性得分的能力很重要。计算精确的GED值通常是一个NP硬性问题，传统算法通常在准确性和效率之间实现不令人满意的权衡。最近，图形神经网络（GNNS）为该任务提供了数据驱动的解决方案，该解决方案更有效，同时保持小图中的预测准确性（每图约10个节点）相似性计算。现有的基于GNN的方法分别嵌入了两个图（缺乏低水平的横向互动）或用于整个图表对（冗余和耗时）的部署跨冲突相互作用，在图中的节点数量增加。在本文中，我们着重于大规模图的相似性计算，并提出了“嵌入式磨合匹配”框架cosimgnn，该框架首先嵌入和粗大图形具有自适应池操作，然后在污垢的图表上部署细粒度的相互作用，以便在污垢的图形上进行污垢的互动最终相似性得分。此外，我们创建了几个合成数据集，这些数据集为图形相似性计算提供了新的基准测试。已经进行了有关合成数据集和现实世界数据集的详细实验，并且Cosimgnn实现了最佳性能，而推理时间最多是以前的Etab-The-The-The-ART的1/3。

translated by 谷歌翻译

Multivariate Time Series Forecasting with Transfer Entropy Graph

Ziheng Duan , Haoyan Xu , Yida Huang , Jie Feng , Yueyang Wang

分类：机器学习

2020-05-03

多变量时间序列（MTS）预测是许多领域的重要问题。准确的预测结果可以有效地帮助决策。迄今为止，已经提出了许多MTS预测方法并广泛应用。但是，这些方法假设单个变量的预测值受到所有其他变量的影响，这忽略了变量之间的因果关系。为了解决上述问题，我们提出了一种新的端到端深度学习模式，称为本文的神经格兰特因果关系图形神经网络（CAUGNN）。要在变量间的因果信息中表征，我们在模型中介绍了神经格子因果关系图。每个变量被视为图形节点，每个边缘表示变量之间的随意关系。另外，具有不同感知尺度的卷积神经网络（CNN）过滤器用于时间序列特征提取，其用于生成每个节点的特征。最后，采用图形神经网络（GNN）来解决MTS产生的图形结构的预测问题。来自现实世界的三个基准数据集用于评估提议的Caugnn。综合实验表明，该方法在MTS预测任务中实现了最先进的结果。

translated by 谷歌翻译

EBHI-Seg: A Novel Enteroscope Biopsy Histopathological Haematoxylin and Eosin Image Dataset for Image Segmentation Tasks

Liyu Shi , Xiaoyan Li , Weiming Hua , Haoyuan Chen , Jing Chen , Zizhen Fan , Minghe Gao , Yujie Jing , Guotao Lu , Deguo Ma

分类：计算机视觉

2022-12-01

Background and Purpose: Colorectal cancer is a common fatal malignancy, the fourth most common cancer in men, and the third most common cancer in women worldwide. Timely detection of cancer in its early stages is essential for treating the disease. Currently, there is a lack of datasets for histopathological image segmentation of rectal cancer, which often hampers the assessment accuracy when computer technology is used to aid in diagnosis. Methods: This present study provided a new publicly available Enteroscope Biopsy Histopathological Hematoxylin and Eosin Image Dataset for Image Segmentation Tasks (EBHI-Seg). To demonstrate the validity and extensiveness of EBHI-Seg, the experimental results for EBHI-Seg are evaluated using classical machine learning methods and deep learning methods. Results: The experimental results showed that deep learning methods had a better image segmentation performance when utilizing EBHI-Seg. The maximum accuracy of the Dice evaluation metric for the classical machine learning method is 0.948, while the Dice evaluation metric for the deep learning method is 0.965. Conclusion: This publicly available dataset contained 5,170 images of six types of tumor differentiation stages and the corresponding ground truth images. The dataset can provide researchers with new segmentation algorithms for medical diagnosis of colorectal cancer, which can be used in the clinical setting to help doctors and patients.

translated by 谷歌翻译

Adaptive Weighted Nonnegative Matrix Factorization for Robust Feature Representation

Tingting Shen , Junhang Li , Can Tong , Qiang He , Chen Li , Yudong Yao , Yueyang Teng

分类：机器学习

2022-06-07

非负矩阵分解（NMF）已广泛用于降低机器学习的尺寸。但是，传统的NMF无法正确处理异常值，因此对噪声敏感。为了提高NMF的鲁棒性，本文提出了一种自适应加权NMF，它引入了权重，以强调每个数据点的不同重要性，因此降低了对噪声数据的算法敏感性。它与使用缓慢生长相似性度量的现有强大NMF大不相同。具体而言，提出了两种实现这一目标的策略：模糊加权技术和熵加权技术，两者都导致具有简单形式的迭代解决方案。实验结果表明，新方法在具有噪声的几个真实数据集上具有更健壮的特征表示，而不是进行噪声。

translated by 谷歌翻译

Nonstationary Bandit Learning via Predictive Sampling

Yueyang Liu , Benjamin Van Roy , Kuang Xu

分类：机器学习 | (统计)机器学习

2022-05-04

Thompson sampling has proven effective across a wide range of stationary bandit environments. However, as we demonstrate in this paper, it can perform poorly when applied to nonstationary environments. We show that such failures are attributed to the fact that, when exploring, the algorithm does not differentiate actions based on how quickly the information acquired loses its usefulness due to nonstationarity. Building upon this insight, we propose predictive sampling, which extends Thompson sampling to do this. We establish a Bayesian regret bound and establish that, in nonstationary bandit environments, the regret incurred by Thompson sampling can far exceed that of predictive sampling. We also present implementations of predictive sampling that scale to complex bandit environments of practical interest in a computationally tractable manner. Through simulations, we demonstrate that predictive sampling outperforms Thompson sampling and other state-of-the-art algorithms across a wide range of nonstationary bandit environments.

translated by 谷歌翻译

Gaussian Imagination in Bandit Learning

Yueyang Liu , Adithya M. Devraj , Benjamin Van Roy , Kuang Xu

分类：机器学习 | (统计)机器学习

2022-01-06

假设发行版是高斯通常促进别侵害的计算。我们考虑一个旨在实现与具有高斯的先前分配和高斯似然函数的强盗环境获得低信息比的代理，但是在应用于伯努利强盗时研究代理的性能。当代理商与Bernoulli强盗互动时，我们建立了贝叶斯遗憾的增加，相对于对高斯匪徒的信息定理束缚。如果高斯的现有分配和似然函数足够弥散，则随着时间的平方根，这种增加的增加，因此每次时间增长都会增加消失。我们的结果正式化了所谓的贝叶斯代理在漫反射错过分布的差异时所谓的贝叶斯代理人仍然有效。

translated by 谷歌翻译

Robust Convergence in Federated Learning through Label-wise Clustering

Hunmin Lee , Yueyang Liu , Donghyun Kim , Yingshu Li

分类：机器学习 | 人工智能

2021-12-28

当地客户的非IID数据集和异构环境被认为是联邦学习（FL）的一个主要问题，导致收敛性低迷而不会实现令人满意的性能。在本文中，我们提出了一种新颖的标签 - 方面聚类算法，可以通过选择与数据集接近的本地模型来保证地理位置分散的异构本地客户端之间的培训性能够近似于均匀分布式的类标签，这可能获得更快的最小化最小化损失并增加了流网络中的准确性。通过对建议的六种共同的非IID情景进行实验，经验证明，Vanilla FL聚合模型无法获得强大的收敛，产生偏置预先训练的本地模型，并漂移局部权重以误导最坏情况下的培训性。此外，我们在训练前定量估计本地模型的预期性能，它提供全球服务器，用于选择最佳客户，节省额外的计算成本。最终，为了在这种非IID情况下定位非收敛性，我们基于本地输入类标签设计集群算法，适应可能导致整体系统实现SWIFT融合作为全球培训的多样性和什锦客户继续。我们的论文显示，当本地训练数据集是非IID的非IID时，拟议的标签 - 明智的聚类与其他FL算法相比，与其他FL算法相比，表现出了提示和强大的融合。

translated by 谷歌翻译